max length | sentence |
---|---|
4 | "대부분의 인명피해가 주택화재에서 발생하고 있습니다. |
4 | 대부분의 아이폰과 아이패드 이용자들은 아이클라우드라는 클라우드 서비스를 이용한다. |
4 | 어머니가 여자배구 국가대표 선수셨거든요.” |
4 | 버거킹은 출근시간 지하철에서 ‘아침은 왕처럼’ 캠페인을 실시했다. |
4 | 농지세는 보통작물을 생산하는 전답(갑류)과 특수작물을 생산하는 전답(을류)으로 구분하여 부과한다. |
4 | 한마디로, "하나님의 오른편은 하나님과 버금가는 지위이다". |
4 | 행정정보를 공동으로 이용하는 서비스가 펼쳐진다. |
4 | 공부하면서 나름대로 서브노트를 만들어서 자기것으로 만드는것이 정말중요한것 같습니다. |
4 | 최고경영자조찬회는 명사들이 자발적으로 선택하고 참석하는 명강의로도 유명하다. |
4 | 우리나라 전체에서 발생하는 슬러지류의 발생량과 처리현황을 1999년 기준으로 나타냈다. |
4 | 2002년 서울대는 약속대로 장애우를 대상으로 특별전형을 실시했다. |
4 | 한국언론진흥재단은 2006년 문화체육관광부로부터 국내에서 유일하게 ‘뉴스저작권 신탁관리 기관’으로 선정되었죠. |
4 | 우리나라 이랜드그룹은 2009년부터 스파오라는 브랜드로 SPA사업을 시작했다. |
4 | 민노당은 북한노동당의 2중대이고, 민주당은 민노당의 2중대이고, 한나라당은 민주당의 2중대이다. |
4 | 닫힌공간(air-NFRC)에서 library를 들어가보면 ISO15099 model이 기본값으로 설정되어 사용하고 있었습니다. |
4 | 브랜디드 프로그램 패키지란 프로그램 스토리에 브랜드를 직간접적으로 노출시키는 PPL형식의 홍보전략이다. |
3 | '박카스 아줌마' 문제는 십수년 전부터 이어져왔다. |
3 | '언프리티 랩스타'는 대한민국을 힙합으로 물들인 '쇼미더머니'의 스핀오프 프로그램. |
3 | '전기요금 현실화와 사회적 수용성'을 주제로 진행하였습니다. |
3 | '오아시스의 강력한 아비스모'가 나타났다. |
3 | '과학드라마'는 단순히 과학자나 과학지식을 소재로 사용하는 드라마를 지칭하는 용어가 아니다. |
3 | '불량식품과의 전쟁'을 선언한 경찰이 불량식품 단속에 뛰어들면서 과열양상마저 나타나고 있다는 지적이다. |
3 | ‘함께 일하는 세상’은 일자리를 제공하는 형태의 대표적 사회적기업이다. |
3 | ‘우리 지역의 역사를 배워요!’ |
3 | ‘신뢰 프로세스’가 작동되기 위해서는 남북한이 하루속히 대화에 나서야 합니다. |
3 | ‘부산·마산 소요사건의 실태와 대책’이란 제목으로 브리핑한 내용의 요지는 다음과 같았다. |
3 | ‘청년’ 김종현 통합진보당 후보는 ‘젊은 충주’를 강조하며 세대교체를 부르짖었다. |
3 | ‘하림’의 언플러그드 음악이 아날로그와 통하고, ‘변정민’의 세련된 감성이 클래식과 통해서일 것이라는 생각이 들었습니다. |
3 | ‘희망’이라는 이름의 버스로 서로를 찾아가 위로하고 연대하기도 합니다. |
3 | ‘페이지 원’의 매력은 무엇보다도 다양한 물량이 있다는 점이다. |
In this subsection, we order the sentences by the length of the shortest word an look for the sentences with the largest values. As explained in subsection 4.5.2.3, we expect to find non-typical sentences.
select min(char_length(word)) as a, s.sentence from sentences s, inv_w i, words w where s.s_id=i.s_id and i.w_id=w.w_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by a desc limit 30;
4.5.2.1 Maximum word rank in sentence
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.8 Sentences consisting of long words only II